Telegram Group »
Saudi Arabia »
Библиотека дата сайентиста | Data Science Machine learning анализ данных машинное обучение » Telegram Webview
Forwarded from Библиотека задач по Data Science | тесты, код, задания
Аналитик-разработчик (AliceGPT) — от 300 000 до 450 000 ₽, гибрид (Москва)
Дата Саентист (Data Scientist), офис (Москва)
Data-инженер (команда Data Lake), офис (Москва)
Data Scientist, удалёнка
Инженер по машинному обучению — от 250 000 ₽, удалёнка
Data Analyst — от 80 000 до 100 000 ₽, удалёнка
Библиотека дата-сайентиста
Please open Telegram to view this post
VIEW IN TELEGRAM
🇦🇪 UAE делает ставку на ИИ — и открывает доступ к ChatGPT Plus для всех
Объединённые Арабские Эмираты стали первой страной в мире, предоставившей бесплатный доступ к ChatGPT Plus всем жителям и гражданам.
Это часть масштабной инициативы Stargate UAE, цель которой — создать крупнейший в мире ИИ-суперкомпьютерный кластер, поддерживаемый такими гигантами, как:
➡️ OpenAI
➡️ Oracle
➡️ Nvidia
➡️ SoftBank
➡️ Cisco
➡️ G42
Кроме того, в Абу-Даби начнётся строительство ИИ-кампуса мощностью 5 гигаватт — самого большого за пределами США. Его мощности хватит для «обслуживания» целого американского штата.
📣 В США мнения разделились: одни считают, что ИИ-экспансия за рубежом несёт риски, другие — что это стратегический шаг в глобальном соперничестве с Китаем.
👉 Подробности: https://clc.to/wN4d5Q
💬 Вы бы пользовались ChatGPT Plus, если доступ был бесплатным?
За что, по-вашему, стоит платить в подписке Plus — и стоит ли вообще?
Библиотека дата-сайентиста #свежак
Объединённые Арабские Эмираты стали первой страной в мире, предоставившей бесплатный доступ к ChatGPT Plus всем жителям и гражданам.
Это часть масштабной инициативы Stargate UAE, цель которой — создать крупнейший в мире ИИ-суперкомпьютерный кластер, поддерживаемый такими гигантами, как:
Кроме того, в Абу-Даби начнётся строительство ИИ-кампуса мощностью 5 гигаватт — самого большого за пределами США. Его мощности хватит для «обслуживания» целого американского штата.
📣 В США мнения разделились: одни считают, что ИИ-экспансия за рубежом несёт риски, другие — что это стратегический шаг в глобальном соперничестве с Китаем.
👉 Подробности: https://clc.to/wN4d5Q
За что, по-вашему, стоит платить в подписке Plus — и стоит ли вообще?
Библиотека дата-сайентиста #свежак
Please open Telegram to view this post
VIEW IN TELEGRAM
`torchao` — это новая экспериментальная библиотека от команды PyTorch, разработанная для простого применения квантования, разреживания и других оптимизаций к нейросетевым моделям.
Основные возможности:
torch.ao.quantization
torch.compile
, dynamo
, inductor
)sparsity
), структурных трансформацийЕсли вы хотите:
то
torchao
может стать отличной альтернативой более сложным инструментам квантования.Пример использования:
from torchao.quant import autoquant
# Загружаем обученную модель
model = torchvision.models.resnet18(pretrained=True).eval()
# Применяем автоматическое квантование
model = autoquant(model)
Библиотека дата-сайентиста #буст
Please open Telegram to view this post
VIEW IN TELEGRAM
😳 Почему дата-сайентисты застревают на уровне «делаю отчеты и строю модельки»
Проблема большинства спецов: вы отлично знаете pandas, sklearn и даже можете настроить нейронку. Но когда дело доходит до создания автономных систем, которые принимают решения без человека — тупик.
При этом большинство курсов по ИИ либо для программистов (и там про API больше, чем про данные), либо академические (теория без практики).
🔥Поэтому мы запускаем курс «AI-агенты для DS-специалистов»
🧐 Что будет на курсе:
— Рассмотрим реализацию памяти в цепочках langchain и создадим пару простых агентов.
— Соберем полный пайплайн RAG-системы с оценкой качества.
— Изучим основные понятия мультиагентных систем (MAS) и библиотеки для их построения.
— Рассмотрим протокол MCP и фреймворк FastMCP, создадим end-to-end приложение.
🎁 В честь запуска курса мы дарим промокод PROGLIBAI на 10 000 ₽ на два других обучения:
— Математика для Data Science
— Алгоритмы и структуры данных
После этих курсов вы перестанете быть «тем, кто делает отчеты» и станете архитектором умных систем. А это совсем другой уровень зарплаты и востребованности.
👉 Успейте использовать промокод и забрать новый курс по приятной цене до 1 июня: https://clc.to/Cttu7A
Проблема большинства спецов: вы отлично знаете pandas, sklearn и даже можете настроить нейронку. Но когда дело доходит до создания автономных систем, которые принимают решения без человека — тупик.
При этом большинство курсов по ИИ либо для программистов (и там про API больше, чем про данные), либо академические (теория без практики).
🔥Поэтому мы запускаем курс «AI-агенты для DS-специалистов»
🧐 Что будет на курсе:
— Рассмотрим реализацию памяти в цепочках langchain и создадим пару простых агентов.
— Соберем полный пайплайн RAG-системы с оценкой качества.
— Изучим основные понятия мультиагентных систем (MAS) и библиотеки для их построения.
— Рассмотрим протокол MCP и фреймворк FastMCP, создадим end-to-end приложение.
🎁 В честь запуска курса мы дарим промокод PROGLIBAI на 10 000 ₽ на два других обучения:
— Математика для Data Science
— Алгоритмы и структуры данных
После этих курсов вы перестанете быть «тем, кто делает отчеты» и станете архитектором умных систем. А это совсем другой уровень зарплаты и востребованности.
👉 Успейте использовать промокод и забрать новый курс по приятной цене до 1 июня: https://clc.to/Cttu7A
🔍 ML после релиза: почему модель может сломаться — и как это вовремя заметить
Внедрили модель, подтвердили гипотезу, получили эффект — работа сделана? Увы, нет.
После деплоя начинается настоящее испытание:
— данные меняются,
— поведение пользователей эволюционирует,
— а ваша модель может незаметно терять эффективность.
📌 Must-read для тех, кто работает с ML в продакшене и хочет, чтобы решения были устойчивыми, а не разовыми.
👉 Читайте, делитесь и не забывайте наблюдать за своими моделями: https://proglib.io/sh/fjpFLVWn8Z
Библиотека дата-сайентиста
Внедрили модель, подтвердили гипотезу, получили эффект — работа сделана? Увы, нет.
После деплоя начинается настоящее испытание:
— данные меняются,
— поведение пользователей эволюционирует,
— а ваша модель может незаметно терять эффективность.
📌 Must-read для тех, кто работает с ML в продакшене и хочет, чтобы решения были устойчивыми, а не разовыми.
👉 Читайте, делитесь и не забывайте наблюдать за своими моделями: https://proglib.io/sh/fjpFLVWn8Z
Библиотека дата-сайентиста
📌 Промт дня: анализ важности признаков после обучения модели
После того как вы обучили модель (особенно если это ансамблевый метод вроде Random Forest или градиентного бустинга), важно понять, какие признаки влияют на предсказания.
Это помогает:
— интерпретировать модель,
— упростить её (feature selection),
— обнаружить «лишние» или дублирующие признаки.
Промт:
Рекомендованные инструменты:
✅
✅
✅
Библиотека дата-сайентиста #буст
После того как вы обучили модель (особенно если это ансамблевый метод вроде Random Forest или градиентного бустинга), важно понять, какие признаки влияют на предсказания.
Это помогает:
— интерпретировать модель,
— упростить её (feature selection),
— обнаружить «лишние» или дублирующие признаки.
Промт:
Проанализируй важность признаков обученной модели. Выполни следующие шаги:
— Извлеки и отсортируй признаки по степени важности.
— Построй barplot с топ-10 признаками.
— Проверь, есть ли признаки с нулевой или близкой к нулю важностью — возможно, их можно удалить.
— Если модель поддерживает SHAP / permutation importance — добавь соответствующую визуализацию.
— Сформулируй гипотезы: почему те или иные признаки оказались важны? Как это согласуется с предметной областью?
Рекомендованные инструменты:
model.feature_importances_
— в sklearn-моделях, XGBoost, LightGBMeli5
, shap
, sklearn.inspection.permutation_importance
— для глубокой интерпретацииseaborn.barplot
, matplotlib
— для наглядных графиковБиблиотека дата-сайентиста #буст
Please open Telegram to view this post
VIEW IN TELEGRAM
😱 Вся правда об увольнениях в IT в 2025-м
Пока все молчат о том, что происходит на рынке, мы решили выяснить реальную картину. Без прикрас и корпоративного пиара.
Но для этого нам нужна ваша помощь! Мы собираем данные от разработчиков, тестировщиков, менеджеров и всех, кто работает в ИТ, чтобы создать честное исследование о:
— реальных причинах массовых увольнений
— судьбе тех, кто остался за бортом IT-рынка
— том, сколько времени сейчас нужно на поиск работы
Почему это важно? Потому что сила в правде. Зная реальную ситуацию, вы сможете лучше понимать тренды рынка и планировать карьеру.
⚡️Пройдите опрос и помогите всему сообществу: https://clc.to/yJ5krg
Пока все молчат о том, что происходит на рынке, мы решили выяснить реальную картину. Без прикрас и корпоративного пиара.
Но для этого нам нужна ваша помощь! Мы собираем данные от разработчиков, тестировщиков, менеджеров и всех, кто работает в ИТ, чтобы создать честное исследование о:
— реальных причинах массовых увольнений
— судьбе тех, кто остался за бортом IT-рынка
— том, сколько времени сейчас нужно на поиск работы
Почему это важно? Потому что сила в правде. Зная реальную ситуацию, вы сможете лучше понимать тренды рынка и планировать карьеру.
⚡️Пройдите опрос и помогите всему сообществу: https://clc.to/yJ5krg
🧪 How-to: применить bootstrapping для оценки статистик
Когда данных немного или нет уверенности в распределении, bootstrapping приходит на помощь. Это техника, позволяющая оценить доверительные интервалы и стабильность метрик без строгих статистических предположений.
🚩 Что делать
Мы будем многократно пересэмплировать нашу выборку с возвращением и оценивать интересующую статистику (среднее, медиану, разницу, корреляцию и т.д.).
🚩 Шаги:
1️⃣ Импорт библиотек:
2️⃣ Готовим данные:
3️⃣ Запускаем бутстрэп:
4️⃣ Оцениваем результат:
🚩 На что обратить внимание:
📍 Используйте не менее 1000 итераций для устойчивых результатов.
📍 При маленьких выборках возможны смещения и высокая дисперсия.
📍 Если данные сильно несбалансированы — будьте осторожны с интерпретацией.
🚩 Основные преимущества:
✔️ Гибкость — можно применять к любым статистикам, особенно если неизвестно теоретическое распределение.
✔️ Без предположений — не требует априорных знаний о распределении в популяции.
✔️ Надёжность — работает даже при небольшом объёме выборки.
Библиотека дата-сайентиста #буст
Когда данных немного или нет уверенности в распределении, bootstrapping приходит на помощь. Это техника, позволяющая оценить доверительные интервалы и стабильность метрик без строгих статистических предположений.
Мы будем многократно пересэмплировать нашу выборку с возвращением и оценивать интересующую статистику (среднее, медиану, разницу, корреляцию и т.д.).
import numpy as np
from sklearn.utils import resample
data = np.array([12, 15, 14, 10, 8, 11, 13]) # пример
boot_means = []
for _ in range(1000): # количество повторений
sample = resample(data, replace=True)
boot_means.append(np.mean(sample))
conf_int = np.percentile(boot_means, [2.5, 97.5])
print(f"95% доверительный интервал для среднего: {conf_int}")
✔️ Гибкость — можно применять к любым статистикам, особенно если неизвестно теоретическое распределение.
✔️ Без предположений — не требует априорных знаний о распределении в популяции.
✔️ Надёжность — работает даже при небольшом объёме выборки.
Библиотека дата-сайентиста #буст
Please open Telegram to view this post
VIEW IN TELEGRAM
👾 AI-агенты — настоящее, о котором все говорят
На днях мы анонсировали наш новый курс AI-агенты для DS-специалистов 🎉
Это продвинутая программа для тех, кто хочет получить прикладной опыт с LLM и решать сложные задачи!
На обучении вы соберете полноценные LLM-системы с учётом особенностей доменных областей, получите hands-on навыки RAG, Crew-AI / Autogen / LangGraph и агентов.
🎓 В рамках курса вы научитесь:
— адаптировать LLM под разные предметные области и данные
— собирать свою RAG-систему: от ретривера и реранкера до генератора и оценки качества
— строить AI-агентов с нуля — на основе сценариев, функций и взаимодействия с внешней средой
Разберете реальные кейсы и научитесь применять похожие подходы в разных доменных областях, получите фундамент для уверенного прохождения NLP system design интервью и перехода на следующий грейд.
Старт 5 июля, а при оплате до 1 июня действует дополнительная скидка и бонус — эксклюзивный лонгрид по API и ML от Proglib.
Начните осваивать тему уже сейчас 👉 https://clc.to/Cttu7A
На днях мы анонсировали наш новый курс AI-агенты для DS-специалистов 🎉
Это продвинутая программа для тех, кто хочет получить прикладной опыт с LLM и решать сложные задачи!
На обучении вы соберете полноценные LLM-системы с учётом особенностей доменных областей, получите hands-on навыки RAG, Crew-AI / Autogen / LangGraph и агентов.
🎓 В рамках курса вы научитесь:
— адаптировать LLM под разные предметные области и данные
— собирать свою RAG-систему: от ретривера и реранкера до генератора и оценки качества
— строить AI-агентов с нуля — на основе сценариев, функций и взаимодействия с внешней средой
Разберете реальные кейсы и научитесь применять похожие подходы в разных доменных областях, получите фундамент для уверенного прохождения NLP system design интервью и перехода на следующий грейд.
Старт 5 июля, а при оплате до 1 июня действует дополнительная скидка и бонус — эксклюзивный лонгрид по API и ML от Proglib.
Начните осваивать тему уже сейчас 👉 https://clc.to/Cttu7A
proglib.academy
Курс|AI-агенты для DS-специалистов
На курсе ты разберёшься, как работают AI-агенты и как их применять в работе — от текстовых помощников до систем, помогающих принимать решения. Разберем архитектуру агентов, связку с внешними API, пайплайны действий и популярные библиотеки. Курс включает реальные…
Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение pinned «👾 AI-агенты — настоящее, о котором все говорят На днях мы анонсировали наш новый курс AI-агенты для DS-специалистов 🎉 Это продвинутая программа для тех, кто хочет получить прикладной опыт с LLM и решать сложные задачи! На обучении вы соберете полноценные…»
Please open Telegram to view this post
VIEW IN TELEGRAM